Análisis de Datos Exploratorio en el contexto de extracción de datos y remuestreo

نویسنده

  • Chong Ho Yu
چکیده

Today there are quite a few widespread misconceptions of exploratory data analysis (EDA). One of these misperceptions is that EDA is said to be opposed to statistical modeling. Actually, the essence of EDA is not about putting aside all modeling and preconceptions; rather, researchers are urged not to start the analysis with a strong preconception only, and thus modeling is still legitimate in EDA. In addition, the nature of EDA has been changing due to the emergence of new methods and convergence between EDA and other methodologies, such as data mining and resampling. Therefore, conventional conceptual frameworks of EDA might no longer be capable of coping with this trend. In this article, EDA is introduced in the context of data mining and resampling with an emphasis on three goals: cluster detection, variable selection, and pattern recognition. TwoStep clustering, classification trees, and neural networks, which are powerful techniques to accomplish the preceding goals, respectively, are illustrated with concrete examples.

برای دانلود رایگان متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Aplicación de Minería de Datos para la Detección de Anomalías: Un Caso de Estudio

La Minería de Datos es una de las soluciones de la Inteligencia de Negocios, que ayuda a extraer conocimiento a partir de datos que las empresas han generado producto de su negocio. Este conocimiento puede generar aplicaciones de alto valor agregado si el proceso de Minería de Datos es entendido apropiadamente desde una perspectiva del negocio. Aplicaciones tales como detección de anomalías par...

متن کامل

Una Metodología Basada en ISO/IEC 15939 para la Elaboración de Planes de Medición de Calidad de Datos

Resumen. Hoy en día, los datos juegan un papel fundamental en las organizaciones y la gestión de su calidad se está convirtiendo en una actividad imprescindible. Como parte de dicha gestión, y en aras de obtener medidas útiles, las organizaciones necesitan realizar planes de medición de Calidad de los Datos (CD). Estos planes de medición deben hacerse teniendo en cuenta la propia naturaleza de ...

متن کامل

Detección de patrones de movilidad en datos de localización aplicando modelos de tópicos

Resumen. De manera natural las personas vamos formando rutinas para adaptarnos al entorno social en el cuál nos desempeñamos. Estas rutinas se ven reflejadas en las secuencias de ubicaciones que visitamos para desplazarnos hacia los lugares donde realizamos nuestras actividades diarias, sin embargo, ¿cómo podemos determinar la presencia de ellas? El presente trabajo consiste en un análisis expl...

متن کامل

Minería de Datos Aplicada a la Detección de Patrones Delictivos en Argentina

This article describes a Project of Data mining in the area of the criminal information, analyzing. The fraudulent homicides committed in the Republic Argentina using a tool of free distribution. 1. Estadistica y Mineria de Datos: Abordajes complementarios El abordaje metodológico-estadístico utilizado por el análisis e interpretación sobre criminalidad en la Argentina actualmente en uso en la ...

متن کامل

Guía de diseño basada en el Modelo de Motivación del Negocio BMM* para la mejora del alineamiento entre el Almacén de Datos y la Estrategia del Negocio

* Business Motivation Model Resumen Garantizar que los almacenes de datos estén alineados a la estrategia del negocio es primordial para su éxito, ya que éstos son utilizados por los sistemas de apoyo a la toma de decisiones con el fin lograr el plan estratégico de la organización. En este contexto, el grupo de investigación Lucentia se ha preocupado por diseñar AD en el contexto organizacional...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2010